首页> 外文OA文献 >EVE: Explainable Vector Based Embedding Technique Using Wikipedia
【2h】

EVE: Explainable Vector Based Embedding Technique Using Wikipedia

机译:EVE:使用维基百科可解释的基于矢量的嵌入技术

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

We present an unsupervised explainable word embedding technique, called EVE,which is built upon the structure of Wikipedia. The proposed model defines thedimensions of a semantic vector representing a word using human-readablelabels, thereby it readily interpretable. Specifically, each vector isconstructed using the Wikipedia category graph structure together with theWikipedia article link structure. To test the effectiveness of the proposedword embedding model, we consider its usefulness in three fundamental tasks: 1)intruder detection - to evaluate its ability to identify a non-coherent vectorfrom a list of coherent vectors, 2) ability to cluster - to evaluate itstendency to group related vectors together while keeping unrelated vectors inseparate clusters, and 3) sorting relevant items first - to evaluate itsability to rank vectors (items) relevant to the query in the top order of theresult. For each task, we also propose a strategy to generate a task-specifichuman-interpretable explanation from the model. These demonstrate the overalleffectiveness of the explainable embeddings generated by EVE. Finally, wecompare EVE with the Word2Vec, FastText, and GloVe embedding techniques acrossthe three tasks, and report improvements over the state-of-the-art.
机译:我们提出了一种无监督的可解释词嵌入技术,称为EVE,该技术建立在Wikipedia的结构上。所提出的模型使用人类可读的标签定义了表示单词的语义向量的维度,从而易于解释。具体而言,使用Wikipedia类别图结构和Wikipedia文章链接结构来构造每个向量。为了测试所提出的词嵌入模型的有效性,我们考虑其在三个基本任务中的有用性:1)入侵者检测-评估其从相干向量列表中识别非相干向量的能力,2)聚类能力-评估其倾向性将相关向量归为一组,同时使无关向量保持独立的簇,以及3)首先对相关项目进行排序-以其结果的最高顺序评估其对与查询相关的向量(项目)进行排名的能力。对于每个任务,我们还提出了一种从模型生成特定于任务的人类可解释的解释的策略。这些证明了EVE产生的可解释嵌入的整体有效性。最后,我们将EVE与三个任务的Word2Vec,FastText和GloVe嵌入技术进行了比较,并报告了最新技术的改进。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号